文本挖掘:用计算方法从大量非结构化或半结构化文本中提取信息与模式的过程,常见任务包括关键词/主题提取、情感分析、文本分类、聚类、实体识别与关系抽取等。(也常与 Natural Language Processing 的应用场景重叠。)
/ˈtɛkst ˌmaɪnɪŋ/
Text mining helps companies understand customer feedback.
文本挖掘帮助公司理解客户反馈。
By combining text mining with statistical models, researchers can detect emerging topics across millions of news articles.
通过将文本挖掘与统计模型结合,研究者可以在数百万篇新闻报道中发现正在出现的新话题。
text(文本)+ mining(采矿/挖掘)。这里的 mining 是比喻用法:像从矿石中“挖出”有价值的金属一样,从海量文本中“挖出”有价值的信息与规律。该搭配在信息检索、数据挖掘与计算语言学的发展中逐渐固定为术语。